智能论文笔记

A direct time-of-flight image sensor with in-pixel surface detection and dynamic vision

Istvan Gyongy , Ahmet T. Erdogan , Neale A. W. Dutton , Germán Mora Martín , Alistair Gorman , Hanning Mai , Francesco Mattioli Della Rocca , Robert K. Henderson

分类：计算机视觉

2022-09-23

3D Flash LiDAR是传统扫描激光雷达系统的替代方法，有望在紧凑的外形尺寸中进行精确的深度成像，并且没有运动部件，例如自动驾驶汽车，机器人技术和增强现实（AR）等应用。通常在图像传感器格式中使用单光子，直接飞行时间（DTOF）接收器实施，设备的操作可能会受到需要在室外场景中处理和压缩的大量光子事件的阻碍以及对较大数组的可扩展性。我们在这里提出了一个64x32像素（256x128 spad）DTOF成像器，该成像器通过将像素与嵌入式直方图使用像素一起克服这些局限性，该直方直方图锁定并跟踪返回信号。这大大降低了输出数据帧的大小，可在10 kfps范围内或100 kfps的最大帧速率进行直接深度读数。该传感器可选择性地读数检测表面或传感运动的像素，从而减少功耗和片外处理要求。我们演示了传感器在中端激光雷达中的应用。

translated by 谷歌翻译

MONAI: An open-source framework for deep learning in healthcare

M. Jorge Cardoso , Wenqi Li , Richard Brown , Nic Ma , Eric Kerfoot , Yiheng Wang , Benjamin Murrey , Andriy Myronenko , Can Zhao , Dong Yang

分类：机器学习 | 人工智能 | 计算机视觉

2022-11-04

Artificial Intelligence (AI) is having a tremendous impact across most areas of science. Applications of AI in healthcare have the potential to improve our ability to detect, diagnose, prognose, and intervene on human disease. For AI models to be used clinically, they need to be made safe, reproducible and robust, and the underlying software framework must be aware of the particularities (e.g. geometry, physiology, physics) of medical data being processed. This work introduces MONAI, a freely available, community-supported, and consortium-led PyTorch-based framework for deep learning in healthcare. MONAI extends PyTorch to support medical data, with a particular focus on imaging, and provide purpose-specific AI model architectures, transformations and utilities that streamline the development and deployment of medical AI models. MONAI follows best practices for software-development, providing an easy-to-use, robust, well-documented, and well-tested software framework. MONAI preserves the simple, additive, and compositional approach of its underlying PyTorch libraries. MONAI is being used by and receiving contributions from research, clinical and industrial teams from around the world, who are pursuing applications spanning nearly every aspect of healthcare.

translated by 谷歌翻译

Differentiable Programming for Earth System Modeling

Maximilian Gelbrecht , Alistair White , Sebastian Bathiany , Niklas Boers

分类：机器学习

2022-08-29

地球系统模型（ESM）是数十年到几个世纪以来时间尺度上未来地球系统状态的主要工具，尤其是在响应人为的温室气体释放方面。最先进的ESM可以重现过去150年的观测全球平均温度异常。然而，ESM需要进一步的改进，最重要的是（i）（i）其气候灵敏度的估计，即对大气温室气体升高的温度响应，（ii）诸如温度和降水等关键变量的建模空间模式，例如，（iii）它们对极端天气事件的表示，以及（iv）它们对多稳定地球系统组件的表示及其预测相关突然过渡的能力。在这里，我们认为，使ESMS自动可区分具有巨大的潜力来推进ESM，尤其是在这些主要缺点方面。首先，自动可差度将允许对ESM的客观校准，即，对于大量自由参数的成本函数的最佳值选择，目前主要是手动调整的。其次，机器学习的最新进展（ML）以及观察数据的数量，准确性和解决方案有望与以上一些方面有所帮助，因为ML可以使用ML将观察值的其他信息纳入ESMS。自动不同性是在构建此类混合模型的基本要素，将基于过程的ESM与ML组件相结合。我们记录了最新的工作，展示了自动分化的潜力，以实质上改进的数据知识ESM。

translated by 谷歌翻译

The SIGMORPHON 2022 Shared Task on Morpheme Segmentation

Khuyagbaatar Batsuren , Gábor Bella , Aryaman Arora , Viktor Martinović , Kyle Gorman , Zdeněk Žabokrtský , Amarsanaa Ganbold , Šárka Dohnalová , Magda Ševčíková , Kateřina Pelegrinová

分类：自然语言处理

2022-06-15

Sigmorphon 2022关于词素分割的共享任务挑战了将单词分解为一系列词素的系统，并涵盖了大多数类型的形态：化合物，衍生和弯曲。子任务1，单词级词素细分，涵盖了9种语言的500万个单词（捷克，英语，西班牙语，匈牙利语，法语，意大利语，俄语，拉丁语，蒙古语），并收到了7个团队的13个系统提交，最佳系统平均为97.29％F1在所有语言中得分，英语（93.84％）到拉丁语（99.38％）。子任务2，句子级的词素细分，涵盖了3种语言的18,735个句子（捷克，英语，蒙古人），从3个团队中收到10个系统提交，最好的系统优于所有三种最先进的子字体化方法（BPE（BPE），Ulm，Morfessor2）绝对30.71％。为了促进错误分析并支持任何类型的未来研究，我们发布了所有系统预测，评估脚本和所有黄金标准数据集。

translated by 谷歌翻译

Intra-agent speech permits zero-shot task acquisition

Chen Yan , Federico Carnevale , Petko Georgiev , Adam Santoro , Aurelia Guy , Alistair Muldal , Chia-Chun Hung , Josh Abramson , Timothy Lillicrap , Gregory Wayne

分类：机器学习 | 人工智能 | 自然语言处理

2022-06-07

人类语言学习者暴露于信息丰富的上下文敏感语言，但要大量的原始感觉数据。通过社会语言的使用和彩排和实践的内部过程，语言学习者能够建立高级的语义表示，以解释他们的看法。在这里，我们从人类中的“内在语音”过程中汲取灵感（Vygotsky，1934年），以更好地理解代理内语言在体现行为中的作用。首先，我们正式地将代理语音作为半监督问题，并开发了两种算法，这些算法能够以很少的标记语言数据进行视觉接地字幕。然后，我们通过实验计算不同量的标记数据的缩放曲线，并将数据效率与监督学习基线进行比较。最后，我们将演讲内部的语音纳入3D虚拟世界中运行的体现的移动操纵剂代理，并表明，只需多达150个附加图像标题，代理语音就可以操纵和回答有关的问题。一个没有任何相关任务经验的新对象（零射）。综上所述，我们的实验表明，对代理内部的语音进行建模有效，可以使体现的代理有效地学习新任务，而无需直接互动经验。

translated by 谷歌翻译

Evaluating Multimodal Interactive Agents

Josh Abramson , Arun Ahuja , Federico Carnevale , Petko Georgiev , Alex Goldin , Alden Hung , Jessica Landon , Timothy Lillicrap , Alistair Muldal , Blake Richards

分类：机器学习 | 人工智能

2022-05-26

创建可以自然与人类互动的代理是人工智能（AI）研究中的共同目标。但是，评估这些互动是具有挑战性的：收集在线人类代理相互作用缓慢而昂贵，但更快的代理指标通常与交互式评估相关。在本文中，我们评估了这些现有评估指标的优点，并提出了一种新颖的评估方法，称为标准化测试套件（STS）。 STS使用从真实人类交互数据中挖掘出的行为方案。代理商请参阅重播方案上下文，接收指令，然后将控制权控制以脱机完成交互。记录这些代理的延续并将其发送给人类注释者以将其标记为成功或失败，并且根据其成功的连续性比例对代理进行排名。最终的ST是自然主义相互作用的快速，控制，可解释的和代表的。总的来说，STS巩固了我们许多标准评估指标中所需的许多值，从而使我们能够加速研究进展，以生产可以自然与人类互动的代理。可以在https://youtu.be/yr1tnggorgq上找到视频。

translated by 谷歌翻译

UniMorph 4.0: Universal Morphology

Khuyagbaatar Batsuren , Omer Goldman , Salam Khalifa , Nizar Habash , Witold Kieraś , Gábor Bella , Brian Leonard , Garrett Nicolai , Kyle Gorman , Yustinus Ghanggo Ate

分类：自然语言处理

2022-05-07

通用形态（UNIMORPH）项目是一项合作的努力，可为数百种世界语言实例化覆盖范围的标准化形态拐角。该项目包括两个主要的推力：一种无独立的特征架构，用于丰富的形态注释，并以各种语言意识到该模式的各种语言的带注释数据的类型级别资源。本文介绍了过去几年对几个方面的扩张和改进（自McCarthy等人（2020年）以来）。众多语言学家的合作努力增加了67种新语言，其中包括30种濒危语言。我们已经对提取管道进行了一些改进，以解决一些问题，例如缺少性别和马克龙信息。我们还修改了模式，使用了形态学现象所需的层次结构，例如多肢体协议和案例堆叠，同时添加了一些缺失的形态特征，以使模式更具包容性。鉴于上一个UniMorph版本，我们还通过16种语言的词素分割增强了数据库。最后，这个新版本通过通过代表来自metphynet的派生过程的实例丰富数据和注释模式来推动将衍生物形态纳入UniMorph中。

translated by 谷歌翻译

COLA: Consistent Learning with Opponent-Learning Awareness

Timon Willi , Johannes Treutlein , Alistair Letcher , Jakob Foerster

分类：机器学习 | 人工智能

2022-03-08

在通用游戏中学习是不稳定的，并且经常导致社会上不受欢迎（占主导地位）的结果。为了减轻这种情况，通过对手的学习意识（LOLA）通过计算每个代理人对对手预期的学习步骤的影响，从而介绍了对手的对手。但是，原始的Lola配方（和后续工作）是不一致的，因为Lola将其他代理商模仿为天真的学习者而不是Lola代理商。在以前的工作中，这种不一致被认为是萝拉未能保留稳定固定点（SFP）的原因。首先，我们将一致性形式化，并表明高阶Lola（Hola）如果汇聚解决了Lola的不一致问题。其次，我们纠正了Sch \“ Afer and Anandkumar（2019）在文献中提出的主张，证明了竞争性梯度下降（CGD）并未作为系列扩展（并且未能解决一致性问题）恢复Hola。第三，我们提出了一种称为一致LOLA（COLA）的新方法，该方法学习在相互对手塑造下保持一致的更新功能。它不需要二阶导数，并且即使Hola无法收敛，也需要一致的更新功能。但是，我们也证明了这一点即使是一致的更新功能也不能保留SFP，这与假设相矛盾：这种缺点是由Lola的不一致引起的。最后，在一系列通用游戏的经验评估中，我们发现可乐找到了亲社的解决方案，并且在更广泛的情况下会融合。与Hola和Lola相比，学习率的范围。我们以简单游戏的理论结果支持后一个发现。

translated by 谷歌翻译

A data-driven approach for learning to control computers

Peter C Humphreys , David Raposo , Toby Pohlen , Gregory Thornton , Rachita Chhaparia , Alistair Muldal , Josh Abramson , Petko Georgiev , Alex Goldin , Adam Santoro

分类：机器学习

2022-02-16

It would be useful for machines to use computers as humans do so that they can aid us in everyday tasks. This is a setting in which there is also the potential to leverage large-scale expert demonstrations and human judgements of interactive behaviour, which are two ingredients that have driven much recent success in AI. Here we investigate the setting of computer control using keyboard and mouse, with goals specified via natural language. Instead of focusing on hand-designed curricula and specialized action spaces, we focus on developing a scalable method centered on reinforcement learning combined with behavioural priors informed by actual human-computer interactions. We achieve state-of-the-art and human-level mean performance across all tasks within the MiniWob++ benchmark, a challenging suite of computer control problems, and find strong evidence of cross-task transfer. These results demonstrate the usefulness of a unified human-agent interface when training machines to use computers. Altogether our results suggest a formula for achieving competency beyond MiniWob++ and towards controlling computers, in general, as a human would.

translated by 谷歌翻译

Creating Multimodal Interactive Agents with Imitation and Self-Supervised Learning

DeepMind Interactive Agents Team , Josh Abramson , Arun Ahuja , Arthur Brussee , Federico Carnevale , Mary Cassin , Felix Fischer , Petko Georgiev , Alex Goldin , Tim Harley

分类：机器学习

2021-12-07

来自科幻小说的普通愿景是机器人将有一天居住在我们的物理空间中，感知世界，才能协助我们的物理劳动力，并通过自然语言与我们沟通。在这里，我们研究如何使用虚拟环境的简化设计如何与人类自然交互的人工代理。我们表明，与自我监督学习的模拟世界中的人类交互的模仿学习足以产生我们称之为MIA的多模式互动剂，这成功与非对抗人类互动75％的时间。我们进一步确定了提高性能的架构和算法技术，例如分层动作选择。完全，我们的结果表明，模仿多模态，实时人类行为可以提供具有丰富的行为的富含性的令人生意的和令人惊讶的有效手段，然后可以为特定目的进行微调，从而铺设基础用于培训互动机器人或数字助理的能力。可以在https://youtu.be/zfgrif7my找到MIA的行为的视频

translated by 谷歌翻译